Search | Global Index Medicus

Aplicação de algoritmos de aprendizagem de máquina para mineração de dados sobre beneficiários de planos de saúde suplementar / Application of machine learning algorithms to data mining about beneficiaries of health insurance / Aplicación de algoritmos de aprendizaje automático para la minería de datos sobre los beneficiarios de losplanes de seguro de salud

Marins, Oudival Luiz Fraccaro de; Barros, Everton Fernando; Romão, Wesley; Constantino, Ademir Aparecido; Souza, Celso Lara.

J. health inform ; 4(2): 43-49, abr.-jun. 2012. ilus

Article in Portuguese | LILACS | ID: lil-683522

ABSTRACT

Grandes bases de dados podem conter conhecimento oculto que poderia auxiliar na tomada de decisões, porém a extração de tal conhecimento não é tarefa trivial sendo necessária a utilização de técnicas de mineração de dados. Operadoras de planos de saúde suplementar normalmente possuem grande quantidade de informações armazenadas a respeito dos procedimentos realizados por seus beneficiários, o que possibilita a existência de conhecimento oculto em suas bases de dados. A literatura apresenta um algoritmo, denominado C5.0, reconhecido como eficiente para resolver a tarefa de classificação em mineração de dados. Neste artigo foram aplicados os algoritmos, de aprendizagem de máquina, C5.0 e PGD (Programação Genética Difusa) em uma base de dados sobre beneficiários de planos de saúde suplementar a fim de validar o algoritmo baseado em programação genética comparando com os resultados da aplicação do algoritmo C5.0.

Large databases may contain hidden knowledge that could assist in making decisions, but the extraction of such knowledge is not trivial task requiring the use of data mining techniques. Operators of health insurance plans typically have large amounts of stored information about the procedures performed by its beneficiaries, which allows the existence of knowledge hidden in their databases. The literature presents an algorithm called C5.0, recognized as effective in solving the classification task in data mining. In this paper we applied the algorithms, machine learning, C5.0 and PGD (Fuzzy Genetic Programming) in a database on beneficiaries of health insurance plans in order to validate the algorithm based on genetic programming compared to the results of applying C5.0 algorithm.

Bases de datos grandes pueden contener conocimiento oculto que podría ayudar en la toma de decisiones, pero la extracción de conocimiento no es tarea trivial y requiere el uso de técnicas de minería de datos. Los operadores de los planes de seguro de salud tienen típicamente una gran cantidad de datos almacenados acerca de los procedimientos realizados por los beneficiarios, lo que permite la existencia del conocimiento oculto en sus bases de datos. La literatura presenta un algoritmo llamado C5.0, reconocido como eficaz en la solución de la tarea de clasificación en la minería de datos. En este trabajo se aplicaron los algoritmos de aprendizaje de máquina, C5.0 y PGD (Programación Genética Fuzzy) en una base de datos sobre los beneficiarios de los planes de seguro de salud con el fin de validar el algoritmo basado en programación genética en comparación con los resultados de la aplicación C5.0 algoritmo.

Subject(s)

Algorithms , Databases as Topic , Medical Informatics , Data Mining , Prepaid Health Plans , Supplemental Health , Decision Making

Pré-processamento para mineração de dados sobre beneficiários de planos de saúde suplementar / Data mining pre-processing for beneficiaries of health insurance / Procesamiento para la minerá de datos los beneficiarios de los planes de salud complementario

Barros, Everton Fernando; Romão, Wesley; Constantino, Ademir Aparecido; Souza, Celso Lara de.

J. health inform ; 3(1): 19-26, jan.-mar. 2011. graf, tab

Article in Portuguese | LILACS | ID: lil-586256

ABSTRACT

Objetivo: O objetivo é preparar dados de um PSS para facilitar a utilização por algoritmos de mineração de dados (MD) e demonstrar uma metodologia para sua preparação. Métodos: Os métodos utilizados para preparar os dados foram propostos por Fayyad: entender o domínio da aplicação; criação de um conjunto de dados alvo; limpeza dos dados, redução e projeção dos dados. Essa metodologia foi aplicada de forma iterativa e interativa: iterativa porque realizou-se consultas a analistas de domínio e interativa porque alguns processos se repetem no decorrer da preparação. Resultados: Conseguiu-se organizar os dados, originalmente em um banco de dados relacional, em apenas uma tabela e reduzir o número de atributos em mais de 50%, além reduzir a quantidade de instâncias em 14%. Conclusão: Demonstrou-se um pré-processamento sobre dados de um PSS e obteve-se dados adequados para serem utilizados por algoritmos de MD.

Objective: The goal is to prepare data from a HI to facilitate the use of data mining (DM) algorithms and demonstrate a methodology for preparation of such data. Methods: The methods used to prepare these data are the methods proposed by Fayyad: understanding the application domain, create a set of target data, data cleansing, data reduction and projection. This methodology are both iterative and interactive. It is iterative by interviews with the domain analysts. It is interactive because the processes are repeated during the preparation. Results: We managed to organize the data, originally in a relational database in just one table and reduce the number of attributes in more than 50%, and reduce the number of instances at 14%. Conclusion: It was shown a pre-processing data from a HI in which obtained data suitable for use by DM algorithms.

Objetivo: El objetivo es preparar a los datos de un soporte técnico para facilitar el uso de algoritmos de minería de datos (MD) y demostrar una metodología para la preparación de estos datos. Métodos: Los métodos utilizados para la preparación de estos datos son los métodos propuestos por Fayyad: comprender el dominio de aplicación, crear un conjunto de datos objetivo, la depuración de datos, reducción de datos y de proyección. Esta metodología se aplicó en una consulta es decir, de manera iterativa con los analistas y el área interactiva en la que los procedimientos se repitieron durante la preparación. Resultados: Se ha podido organizar los datos, originalmente en una base de datos relacional en una sola mesa y reducir el número de atributos en más del 50%, y reducir el número de casos en 14%. Conclusión: Los resultados confirman un pre-tratamiento de los datos de un soporte técnico y obtener datos adecuados para el uso de algoritmos de DM.

Subject(s)

Humans , Databases as Topic , Data Mining , Prepaid Health Plans , Quality Improvement

ABSTRACT

Subject(s)

ABSTRACT

Subject(s)

SEND TO:

SELECTION OF CITATIONS

SEARCH DETAIL